周杰伦的《说好不哭》,20万点评Python来分析
以下文章来源于菜鸟学Python ,作者菜鸟小编
作者 | 菜鸟小编
来源 | 菜鸟学Python(ID:cainiao_xueyuan)
这次小编找的是QQ音乐的评论,看这周董的帅气的封面,音乐才子名不虚传,短短3天已经卖了700万张,看一下评论数有21W的点评数,这人气太旺了!
经过检验发现,当请求的时候,需要大家不断改变的是pagenum和lastcommentid这两个参数。评论爬取的部分程序如下图所示。
这里,通过不断的更新页面数值,并根据爬取的commentid数值来更新lastcommentid的数值,便可以源源不断的爬取到大家的评论,这里,小编爬取了大家的评论和评论时间,昵称以及commentid四个参数,爬取了20万+条评论,如下图所示。
在所爬取的数据中,点赞第一名有14100+的点赞数量,他的评论是这样的:
如上图所示,歌曲是16号23点正式上线与大家见面,立刻引起了大家的评价,可以看见,在歌曲出来的短短一两个小时内,评论数目激增,然后随着入夜大家睡去,评论数目略有下降。而第二天的评论数目虽有小幅度的提升,到那时提升的幅度并不是很大。
这部分的程序如下图所示:
最后为大家展示的是大家评论的词云制作,看看大家对该首歌的印象。
首先,需要对大家的评论进行预处理,因为爬取到的结果中包含众多的字符,这些字符需要去除。程序如下图所示。
上述程序中,我们匹配中文字符和中文标点符号,然后写入指定的文件内,最后利用wordcloud库来制作词云即可:
由上图可以看出,大家对于周董的新歌是非常喜欢的,并且都非常的开心,由于信的加入,导致大家在评论的时候会加入五月天的元素。
以上就是本次小编带来的对于周董新歌的分析,小编也准备去买个vip听一下,好好的欣赏周董的新歌曲啦。
◆
精彩推荐
◆
5大必知的图算法,附Python代码实现
如何用爬虫技术帮助孩子秒到心仪的幼儿园(基础篇)
Python传奇:30年崛起之路 2019年最新华为、BAT、美团、头条、滴滴面试题目及答案汇总
阿里巴巴杨群:高并发场景下Python的性能挑战